Từ khoá mặc định Máy_truy_tìm_dữ_liệu

Nhiều máy truy tìm còn hỗ trợ thêm các từ khoá mặc định. Khi dùng các từ khoá mặc định như một thành phần của bộ từ khoá thì các trang Web được trả về sẽ thoả mãn các đặc tính chuyên biệt hoá theo ý nghĩa mà các từ khoá mặc định này biểu tượng. Các hỗ trợ này cho phép kiểm soát được các loại trang nào muốn truy tìm.

Các từ khoá mặc định kết thúc bằng dấu hai chấm : và chữ (hay cụm từ trong ngoặc kép) của bộ từ khoá nào đứng ngay sau dấu này sẽ bị chi phối bởi điều kiện của từ khoá mặc định, còn các thành phần khác trong từ khoá sẽ không thay đổi ý nghĩa.

  • Các từ khoá mặc định giới hạn máy truy tìm trả về các trang nằm trong một tên miền, hay một miền con. Tuỳ theo máy truy tìm mà các từ khoá mặc định được sử dụng.
    1. Altavista hỗ trợ chức năng này bằng từ khoá host:. Ví dụ, host:mars.jpl.nasa.gov mars saturn chỉ tìm trong mars.jpl.nasa.gov tất cả các trang có chứa chữ "mars" và chữ "saturn".
    2. Excite, Google (Netscape, Yahoo) hỗ trợ chức năng này bằng từ khoá site:, khi kết hợp với các lệnh khác có thể tìm theo cách chuyên biệt. Ví dụ, "carbon nanotech" -host:www.technologyreview.com cho phép tìm tất cả các trang nào có chứa cụm từ "carbon nanotech" ngoại trừ các trang xuất sứ từ www.technologyreview.com
    3. Inktomi (HotBot, iWon, LookSmart) hỗ trợ chức năng này bằng từ khoá domain:. Ví dụ, để tìm các trang có đuôi là ".edu" (thường là trang Web của các đại học) về đề tài "heart transplan", có thể dùng bộ từ khoá "heart transplan" +host:edu để tìm các trang có đuôi gốc là.edu mang đề tài này.
    4. AllTheWeb hỗ trợ các từ khoá domain, url, site: cho chức năng này. Ví dụ, để tìm các trang về "deutch" từ các trang trong nước Đức có thể dùng deutch domain:.de
  • Các từ khoá mặc định dùng để tìm trang có tựa đề chứa một từ (hay cụm từ) đặc biệt:
    1. AltaVista, AllTheWeb, Inktomi (MSN và HotBot) dùng từ khoá title:. Ví dụ, title: "Mars Landing" sẽ giúp truy tìm các trang có đề tựa về Hoả Tinh.
    2. Google và Teoma hỗ trợ các từ khoá intitle:allintitle: ("allintitle:" sẽ ảnh hưởng đến tất cả các chữ đứng sau dấu :).
  • Các từ khoá dùng để tìm các địa chỉ Web nào có chứa từ (hay cụm từ) của bộ từ khoá:
    1. Google hỗ trợ từ khoá inurl:allinurl:.
      • Muốn tìm địa chỉ các trang Web có một chữ đặc biệt thì dùng inurl. Ví dụ, inurl:nasa sẽ giúp tìm tất cả các địa chỉ Web nào có chứa chữ "nasa".
      • Nếu cần truy tìm một địa chỉ có nhiều hơn một chữ thì dùng allinurl. Ví dụ, allinurl:vietnam thetholucbat sẽ giúp tìm tất cả các trang nào mà nội dung địa chỉ của nó chứa chữ "vietnam" hay là chữ "thetholucbat".
    2. Inktomi, AOL, GoTo, HotBot cung cấp từ khoá originurl: cho việc này.
    3. Yahoo thì dùng từ khoá u:
    4. Exite dùng url:
  • Các từ khoá mặc định giúp tìm các trang có cài đặt các liên kết tới địa chỉ trang được ghi trong từ khoá:
    1. Google, Yahoo sẽ cung cấp từ khoá link:. Tuy nhiên, Yahoo yêu cầu địa chỉ trong từ khoá phải có đủ tiếp đầu ngữ http:// thì mới hoạt động hữu hiệu. Ví dụ, bộ từ khoá link:vi.wikipedia.org sẽ giúp truy ra tất cả các trang Web nào có liên kết tới trang Bách khoa toàn thư tiếng Việt này.
    2. MSN hỗ trợ chức năng này bằng từ khoá linkdomain:
  • Ngoài ra, để truy tìm các loại tệp có định dạng (format) đặc biệt thì có thể dùng từ khoá filetype:(đuôi của tập tin):
    1. Google: sẽ hỗ trợ truy tìm các kiểu tệp: PDF, Word (.doc), Excel (.xls), PowerPoint (.ppt) và Rich Text Format (.rtf) cũng như PostScript (.ps), Text (.txt), HTML (.htm hay.html), WordPerfect (.wpd) và các đuôi khác... Ví dụ: laser filetype:pdf sẽ giúp tìm các trang là các tập tin dạng .pdf (.pdf là loại tập tin được dùng trong cá hồ sơ văn bản của phần mềm Adobe Arcobat).
    2. Yahoo cho phép tìm HTML (htm hay html), PDF, Excel (.xls), PowerPoint (.ppt), Word (.doc), RSS/XML (.xml) và tập tin văn bản dạng (.txt).
    3. MSN chỉ hỗ trợ chuyên tìm các loại tệp: HTML, PDF, PowerPoint (.pps hay.ppt), các dạng của Word, hay Excel.
Lưu ý: Đối với các máy truy tìm thì các tệp có đuôi.htm khác với các tệp có đuôi.html. Do đó, nếu muốn tìm một cách chắc chắc tất cả các tệp dạng HTML thì nên tìm làm hai lần, một riêng cho htm và một cho html.